![]() Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
专利摘要:
Eine Vorrichtung zum Verarbeiten eines Multikanalsignals umfasst eine Einrichtung zum Ermitteln einer Ähnlichkeit zwischen einem ersten von zwei Kanälen und einem zweiten der zwei Kanäle. Ferner ist eine Einrichtung zum Durchführen einer Prädiktionsfilterung vorgesehen, die ausgebildet ist, um im Falle einer hohen Ähnlichkeit zwischen dem ersten und dem zweiten Kanal eine Präditionsfilterung mit nur einem einzigen Prädiktionsfilter für beide Kanäle durchzuführen und um im Falle einer Unähnlichkeit zwischen dem ersten und dem zweiten Kanal eine Präditionsfilterung mit zwei getrennten Prädiktionsfiltern durchzuführen. Damit werden eine Einführung von Stereoartefakten und eine Verschlechterung des Codiergewinns bei Stereocodiertechniken vermieden. 公开号:DE102004009954A1 申请号:DE200410009954 申请日:2004-03-01 公开日:2005-09-29 发明作者:Alexander Gröschel;Jürgen HERRE;Michael Schug 申请人:Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV; IPC主号:G10L19-00
专利说明:
[0001] Dievorliegende Erfindung bezieht sich auf Audiocodierer und insbesondereauf Audiocodierer, die Transformtionsbasiert sind, d. h., bei denenzu Beginn der Codierer-Pipelineeine Umsetzung einer zeitlichen Darstellung in eine spektrale Darstellung erfolgt. [0002] Einbekannter Transformations-basierter Audiocodierer ist in 3 gezeigt. Der in 3 gezeigte Codierer istim internationalen Standard ISO/IEC 14496-3: 2001 (E), Subpart 4,Seite 4, dargestellt und in der Technik auch als AAC-Codierer bekannt. [0003] Nachfolgendwird der bekannte Codierer dargestellt. An einem Eingang 1000 wirdein zu codierendes Audiosignal eingespeist. Dieses wird zunächst einerSkalierungsstufe 1002 zugeführt, in der eine sogenannteAAG-Verstärkungssteuerung durchgeführt wird,um den Pegel des Audiosignals festzulegen. Seiteninformationen ausder Skalierung werden einem Bitstromformatierer 1004 zugeführt, wiees durch den Pfeil zwischen dem Block 1002 und dem Block 1004 dargestelltist. Das skalierte Audiosignal wird hierauf einer MDCT-Filterbank 1006 zugeführt. BeimAAC-Codierer implementiert die Filterbank eine modifizierte diskreteCosinustransformation mit 50% überlappendenFenstern, wobei die Fensterlängedurch einen Block 1008 bestimmt wird. [0004] Allgemeingesagt ist der Block 1008 dazu vorhanden, dass transienteSignale mit kürzeren Fensterngefenstert werden, und dass eher stationäre Signale mit längeren Fensterngefenstert werden. Dies dient dazu, dass aufgrund der kürzeren Fenster für transienteSignale eine höhereZeitauflösung(auf Kosten der Frequenzauflösung)erreicht wird, wäh rendfür eherstationäreSignale eine höhereFrequenzauflösung(auf Kosten der Zeitauflösung)durch längereFenster erreicht wird, wobei tendenziell längere Fenster bevorzugt werden,da sie einen größeren Codiergewinnversprechen. Am Ausgang der Filterbank 1006 liegen zeitlichbetrachtet aufeinanderfolgende Blöcke von Spektralwerten vor,die je nach Ausführungsformder Filterbank MDCT-Koeffizienten, Fourier-Koeffizienten oder auch Subbandsignale seinkönnen,wobei jedes Subbandsignal eine bestimmte begrenzte Bandbreite hat,die durch den entsprechenden Subbandkanal in der Filterbank 1006 festgelegtwird, und wobei jedes Subbandsignal eine bestimmte Anzahl von Subband-Abtastwertenaufweist. [0005] Nachfolgendwird beispielhaft der Fall dargestellt, bei dem die Filterbank zeitlichbetrachtet aufeinanderfolgende Blöcke von MDCT-Spektralkoeffizientenausgibt, die allgemein gesagt, aufeinanderfolgende Kurzzeitspektrendes zu codierenden Audiosignals am Eingang 1000 darstellen.Ein Block von MDCT-Spektralwerten wird dann in einen TNS-Verarbeitungsblock 1010 eingespeist,in dem eine zeitliche Rauschformung stattfindet (TNS = temporarynoise shaping). Die TNS-Technik wird dazu verwendet, um die zeitlicheForm des Quantisierungsrauschens innerhalb jedes Fensters der Transformationzu formen. Dies wird dadurch erreicht, dass ein Filterprozess aufTeile der Spektraldaten jedes Kanals angewendet wird. Die Codierungwird auf einer Fensterbasis durchgeführt. Insbesondere werden diefolgenden Schritte ausgeführt,um das TNS-Tool auf ein Fenster spektraler Daten, also auf einenBlock von Spektralwerten anzuwenden. [0006] Zunächst wirdein Frequenzbereich fürdas TNS-Tool ausgewählt.Eine geeignete Auswahl besteht darin, einen Frequenzbereich von1,5 kHz bis zum höchstenmöglichenSkalenfaktorband mit einem Filter abzudecken. Es sei darauf hingewiesen, dassdieser Frequenzbereich von der Abtastrate abhängt, wie es im AAC-Standard(ISO/IEC 14496-3: 2001 (E)) spezifiziert ist. [0007] Anschließend wirdeine LPC-Berechnung (LPC = linear predictive coding = lineare prädiktive Codierung)ausgeführt,und zwar mit den spektralen MDCT-Koeffizienten, die in dem ausgewählten Zielfrequenzbereichliegen. Füreine erhöhteStabilität werdenKoeffizienten, die Frequenzen unter 2,5 kHz entsprechen, aus diesemProzess ausgeschlossen. ÜblicheLPC-Prozeduren, wie sie aus der Sprachverarbeitung bekannt sind,könnenfür dieLPC-Berechnung verwendet werden, beispielsweise der bekannte Levinson-Durbin-Algorithmus.Die Berechnung wird fürdie maximal zulässigeOrdnung des Rauschformungsfilters ausgeführt. [0008] AlsErgebnis der LPC-Berechnung wird der erwartete PrädiktionsgewinnPG erhalten. Ferner werden die Reflexionskoeffizienten oder Parcor-Koeffizientenerhalten. [0009] Wennder Prädiktionsgewinneine bestimmte Schwelle nicht überschreitet,wird das TNS-Tool nicht angewendet. In diesem Fall wird eine Steuerinformationin den Bitstrom geschrieben, damit ein Decodierer weiß, dasskeine TNS-Verarbeitungausgeführt wordenist. [0010] Wennder Prädiktionsgewinnjedoch eine Schwelle überschreitet,wird die TNS-Verarbeitung angewendet. [0011] Ineinem nächstenSchritt werden die Reflexionskoeffizienten quantisiert. Die Ordnungdes verwendeten Rauschformungsfilters wird durch Entfernen allerReflexionskoeffizienten mit einem Absolutwert kleiner als eine Schwellevon dem „Schwanz" des Reflexionskoeffizienten-Arraysbestimmt. Die Anzahl der verbleibenden Reflexionskoeffizienten liegtin der Größenordnungdes Rauschformungsfilters. Eine geeignete Schwelle liegt bei 0,1. [0012] Dieverbleibenden Reflexionskoeffizienten werden typischerweise in linearePrädiktionskoeffizientenumgewandelt, wobei diese Technik auch als "Step-Up"-Prozedur bekannt ist. [0013] Dieberechneten LPC-Koeffizienten werden dann als Codierer-Rauschformungsfilterkoeffizienten,also als Prädiktionsfilterkoeffizientenverwendet. Dieses FIR-Filter wird über den spezifizierten Zielfrequenzbereichgeführt.Bei der Decodierung wird ein autoregressives Filter verwendet, während beider Codierung ein sogenanntes Moving-Average-Filter verwendet wird.Schließlichwerden noch die Seiteninformationen für das TNS-Tool dem Bitstromformatiererzugeführt,wie es durch den Pfeil dargestellt ist, der zwischen dem Block TNS-Verarbeitung110 und dem Bitstromformatierer 1004 in 3 gezeigt ist. [0014] Hieraufwerden mehrere in 3 nichtgezeigte optionale Tools durchlaufen, wie beispielsweise ein Langzeitprädiktions-Tool,ein Intensity/Kopplungs-Tool, ein Prädiktions-Tool, ein Rauschsubstitutions-Tool,bis schließlichzu einem Mitte/Seite-Codierer 1012 gelangt wird. Der Mitte/Seite-Codierer 1012 istdann aktiv, wenn das zu codierende Audiosignal ein Multikanalsignalist, also ein Stereosignal mit einem linken Kanal und einem rechtenKanal. Bisher, also in der Verarbeitungsrichtung vor dem Block 1012 in 3 wurden der linke und derrechte Stereokanal getrennt voneinander verarbeitet, also skaliert,durch die Filterbank transformiert, der TNS-Verarbeitung unterzogenoder nicht etc. [0015] ImMitte/Seite-Codierer wird dann zunächst überprüft, ob eine Mitte/Seite-Codierungsinnvoll ist, also überhaupteinen Codiergewinn bringt. Eine Mitte/Seite-Codierung wird danneinen Codiergewinn bringen, wenn der linke und der rechte Kanaleher ähnlichsind, da dann der Mitte-Kanal, also die Summe aus dem linken unddem rechten Kanal nahezu gleich dem linken oder dem rechten Kanalist, abgesehen von der Skalierung durch den Faktor 112, während derSeite-Kanal nursehr kleine Werte hat, da er gleich der Differenz zwischen dem linkenund dem rechten Kanal ist. Damit ist zu sehen, dass dann, wenn derlinke und der rechte Kanal annähernd gleichsind, die Differenz annäherndNull ist bzw. nur ganz kleine Werte umfasst, die – so istdie Hoffnung – ineinem nachfolgenden Quantisierer 1014 zu Null quantisiertwerden und somit sehr effizient übertragenwerden können,da dem Quantisierer 1014 ein Entropie-Codierer 1016 nachgeschaltetist. [0016] DemQuantisierer 1014 wird von einem psycho-akustischen Modell 1020 eineerlaubte Störung proSkalenfaktorband zugeführt.Der Quantisierer arbeitet iterativ, d. h. es wird zunächst eine äußere Iterationsschleifeaufgerufen, die dann eine innere Iterationsschleife aufruft. Allgemeingesagt wird zunächst,ausgehend von Quantisiererschrittweiten-Startwerten, eine Quantisierungeines Blocks von Werten am Eingang des Quantisierers 1014 vorgenommen.Insbesondere quantisiert die innere Schleife die MDCT-Koeffizienten,wobei eine bestimmte Anzahl von Bits verbraucht wird. Die äußere Schleife berechnetdie Verzerrung und modifizierte Energie der Koeffizienten unterVerwendung des Skalenfaktors, um wieder eine innere Schleife aufzurufen.Dieser Prozess wird iteriert, bis ein bestimmter Bedingungssatzerfülltist. Fürjede Iteration in der äußeren Iterationsschleifewird dabei das Signal rekonstruiert, um die durch die QuantisierungeingeführteStörung zuberechnen und mit der von dem psycho-akustischen Modell 1020 geliefertenerlaubten Störungzu vergleichen. Ferner werden die Skalenfaktoren von Iteration zuIteration um eine Stufe vergrößert, und zwarfür jedeIteration der äußeren Iterationsschleife. [0017] Dann,wenn eine Situation erreicht ist, bei der die durch die QuantisierungeingeführteQuantisierungsstörungunterhalb der durch das psycho-akustische Modell bestimmten erlaubtenStörungist, und wenn gleichzeitig Bitanforderungen erfüllt sind, nämlich, dass eine Maximalbitratenicht überschrittenwird, wird die Iteration, also das Analyse-Durch-Synthese-Verfahren beendet, und es werdendie erhaltenen Skalenfaktoren codiert, wie es in dem Block 1014 ausgeführt istund in codierter Form dem Bitstromformatierer 1004 zu geführt, wiees durch den Pfeil gekennzeichnet ist, der zwischen dem Block 1014 unddem Block 1004 gezeichnet ist. Die quantisierten Wertewerden dann dem Entropie-Codierer 1016 zugeführt, dertypischerweise unter Verwendung mehrerer Huffman-Code-Tabellen für verschiedeneSkalenfaktorbändereine Entropie-Codierung durchführt,um die quantisierten Werte in ein binäres Format zu übertragen.Wie es bekannt ist, wird bei der Entropie-Codierung in Form derHuffman-Codierung auf Code-Tabellen zurückgegriffen, die aufgrund einererwarteten Signalstatistik erstellt werden, und bei denen häufig auftretendeWerte kürzereCode-Wörterbekommen als seltener auftretende Werte. Die entropie-codierten Werte werdendann ebenfalls als eigentliche Hauptinformationen dem Bitstromformatierer 1004 zugeführt, derdann gemäß einerbestimmten Bitstromsyntax ausgangsseitig das codierte Audiosignalausgibt. [0018] Wiees bereits ausgeführtworden ist, wird im TNS-Verarbeitungsblock 1010 zurzeitlichen Formung des Quantisierungsgeräusches innerhalb eines Codierframeseine Prädiktionsfilterungverwendet. [0019] Insbesondereerfolgt die zeitliche Formung des Quantisierungsrauschens zur Filterungder Spektralkoeffizienten überder Frequenz im Codierer vor der Quantisierung und anschließenden inversen Filterungim Decodierer. Die TNS-Verarbeitungbewirkt, dass die Hüllkurvedes Quantisierungsrauschens zeitlich unter die Hüllkurve des Signals geschobenwird, um Vorecho-Artefakte zu vermeiden. Die Anwendung des TNS ergibtsich aus einer Schätzungdes Prädiktionsgewinnsder Filterung, wie es vorstehend ausgeführt worden. Die Filterkoeffizientenfür jedenCodierframe werden überein Korrelationsmaß bestimmt.Die Berechnung der Filterkoeffizienten erfolgt separat für jedenKanal. Sie werden ebenfalls separat im codierten Bitstrom übertragen. [0020] Nachteiligan der Aktivierung/Deaktivierung des TNS-Konzepts ist die Tatsache, dass für jeden Stereokanal,wenn einmal eine TNS-Verarbeitung aufgrund des guten erwartetenCodiergewinns aktiviert werden ist, die TNS-Filterung für jedenKanal getrennt stattfindet. So ist dies bei relativ unterschiedlichenKanälennoch unproblematisch. Sind jedoch der linke und der rechte Kanalrelativ ähnlich, habenalso der linke und der rechte Kanal in einem Extrembeispiel genaudieselbe Nutzinformation, wie beispielsweise ein Sprecher, und unterscheidensich lediglich im Hinblick auf das in den Kanälen unweigerlich enthalteneRauschen, so wird beim Stand der Technik dennoch für jedenKanal ein eigenes TNS-Filter berechnet und verwendet. Nachdem das TNS-Filterdirekt vom linken bzw. rechten Kanal abhängt, und insbesondere auf dieSpektraldaten des linken und des rechten Kanals relativ empfindlichreagiert, wird auch im Falle eines Signals, bei dem der linke undder rechte Kanal sehr ähnlichsind, also im Falle eines sogenannten „Quasi-Mono-Signals", für jedenKanal eine TNS-Verarbeitung mit einem eigenen Prädiktionsfilter durchgeführt. Diesführt dazu, dassaufgrund der unterschiedlichen Filterkoeffizienten auch eine unterschiedlicheszeitliche Rauschformung in den beiden Stereokanälen stattfindet. [0021] Nachteiligan diesem Effekt ist, dass er zu hörbaren Artefakten führen kann,da z. B. das ursprünglichemono-artige Klangbild durch diese zeitlichen Differenzen einen unerwünschtenStereocharakter bekommt. [0022] Dasbekannte Prozedere hat jedoch einen weiten möglicherweise noch schwerwiegenderen Nachteil.Durch die TNS-Verarbeitungwerden die TNS-Ausgangswerte, also die spektralen Restwerte einerMitte/Seite-Codierung im Mitte/Seite-Codierer 1002 von 3 unterzogen. Während vorder TNS-Verarbeitungdie beiden Kanälenoch relativ gleich waren, kann dies nach der TNS-Verarbeitung nichtmehr gesagt werden. Durch den beschriebenen Stereo-Effekt, der durchdie getrennte TNS-Verarbeitung eingeführt worden ist, werden diespektralen Restwerte der beiden Kanäle unähnlicher gemacht, als sie eigentlichsein würden.Dies führtzu einem unmittelbaren Abfall an Codiergewinn aufgrund der Mitte/Seite-Codierung,was insbesondere fürAnwendungen, bei denen eine niedrige Bitrate erforderlich ist, besondersnachteilhaft ist. [0023] Zusammenfassendist die bekannte TNS-Aktivierung somit für Stereosignale, die in beidenKanäle ähnlicheaber nicht exakt identische Signalinformationen benutzen, wie beispielsweisemono-ähnliche Sprachsignale,problematisch. Sofern bei der TNS-Detektion für beide Kanäle unterschiedliche Filterkoeffizientenermittelt werden, führtdas zu einer zeitlich unterschiedlichen Formung des Quantisierungsgeräusches inden Kanälen.Dies kann zu hörbarenArtefakten führen,da z. B. das ursprüngliche mono-artigeKlangbild durch diese zeitlichen Differenzen einen unerwünschtenStereocharakter bekommt. Weiterhin wird, wie es ausgeführt wordenist, das TNS-modifizierte Spektrum in einem nachfolgenden Schritteiner Mitte/Seite-Codierung unterzogen. Unterschiedliche Filterin beiden Kanälenverringern zusätzlichdie Ähnlichkeitder Spektralkoeffizienten und damit den Mitte/Seite-Gewinn. [0024] DieAufgabe der vorliegenden Erfindung besteht darin, ein Konzept zumVerarbeiten eines Multikanalsignals zu schaffen, das geringere Artefakte unddennoch eine gute Komprimierung der Informationen ermöglicht. [0025] DieseAufgabe wird durch eine Vorrichtung zum Verarbeiten eines Multikanalsignalsnach Patentanspruch 1, ein Verfahren zum Verarbeiten eines Multikanalsignalsnach Patentanspruch 12 oder ein Computerprogramm nach Patentanspruch13 gelöst. [0026] Dervorliegenden Erfindung liegt die Erkenntnis zugrunde, dass dann,wenn der linke und der rechte Kanal ähnlich sind, also ein Ähnlichkeitsmaß überschreiten,für beideKanäledie gleiche TNS-Filterung anzuwenden ist. Damit wird sichergestellt, dassdurch die TNS-Verarbeitung keine Pseu do-Stereo-Artefakte in dasMultikanalsignal eingeführtwerden, da durch Verwendung desselben Prädiktionsfilters für beideKanäleerreicht wird, dass auch die zeitliche Formung des Quantisierungsrauschensfür beideKanäleidentisch stattfindet, also dass keine Pseudo-Stereoartefakte zuhören sind. [0027] Darüber hinauswird sichergestellt, dass die Signale nicht unähnlicher werden als sie eigentlich seinmüssten.Die Ähnlichkeitder Signale nach der TNS-Filterung, also die Ähnlichkeit der spektralen Restwerteentspricht dabei der Ähnlichkeitder Eingangssignale in die Filter und nicht, wie im Stand der Technik,der Ähnlichkeitder Eingangssignale, die noch durch unterschiedliche Filter reduziertwird. [0028] Damitwird eine nachfolgende Mitte/Seite-Codierung keine Bitratenverlustehaben, da die Signale nicht unähnlichergemacht worden sind, als sie eigentlich sind. [0029] Natürlich wirddurch Verwenden des selben Prädiktionsfiltersfür beideSignale ein kleiner Verlust an Prädiktionsgewinn auftreten. DieserVerlust wird jedoch nicht so groß sein, da die Synchronisierung derTNS-Filterung fürbeide Kanäleohnehin nur dann eingesetzt wird, wenn die beiden Kanäle ähnlich zueinandersind. Dieser kleine Verlust an Prädiktionsgewinn wird jedoch,wie sich herausgestellt hat, ohne weiteres durch den Mitte/Seite-Gewinnausgeglichen, da durch die TNS-Verarbeitung keine zusätzlicheUnähnlichkeitzwischen linkem und rechtem Kanal eingeführt wird, welche zu einer Reduktiondes Mitte/Seite-Codiergewinns führenwürde. [0030] BevorzugteAusführungsbeispieleder vorliegenden Erfindung werden nachfolgend Bezug nehmend aufdie beiliegenden Zeichnungen detailliert erläutert. Es zeigen: [0031] 1 einBlockschaltbild einer erfindungsgemäßen Vorrichtung zum Verarbeiteneines Multikanalsignals; [0032] 2 einebevorzugte Ausführungsformder Einrichtung zum Ermitteln einer Ähnlichkeit und der Einrichtungzum Durchführender Prädiktionsfilterung;und [0033] 3 einBlockschaltbild eines bekannten Audiocodierers gemäß dem ABC-Standard. [0034] 1 zeigteine Vorrichtung zum Verarbeiten eines Multikanalsignals, wobeidas Multikanalsignal durch je einen Block von Spektralwerten für wenigstenszwei Kanäledargestellt ist, wie es durch L und R gezeigt ist. Die Blöcke vonSpektralwerten werden durch z. B. MDCT-Filterung mittels einer MDCT-Filterbank 10 ausZeitbereichs-Abtastwerten l(t) bzw. r(t) für jeden Kanal ermittelt. [0035] DieBlöckevon Spektralwerten fürjeden Kanal werden dann bei einem bevorzugten Ausführungsbeispielder vorliegenden Erfindung einer Einrichtung 12 zum Ermittelneiner Ähnlichkeitzwischen den beiden Kanälenzugeführt.Alternativ kann die Einrichtung zum Ermitteln der Ähnlichkeitzwischen den beiden Kanälenauch, wie es in 1 gezeigt ist, unter Verwendungvon Zeitbereichs-Abtastwerten l(t) oder r(t) für jeden Kanal durchgeführt werden.Es wird jedoch bevorzugt, die aus der Filterbank 10 erhaltenenBlöckevon Spektralwerten zur Ähnlichkeitsbestimmungzu verwenden, da diese gleichermaßen durch mögliche Effekte der Filterungin der Filterbank 10 beeinflusst sind. [0036] DieEinrichtung 12 zum Ermitteln der Ähnlichkeit zwischen dem erstenund dem zweiten Kanal ist wirksam, um basierend auf einem Ähnlichkeitsmaß oder alternativeinem Unähnlichkeitsmaß ein Steuersignalan einer Steuerleitung 14 zu erzeugen, das wenigstens zweiZuständehat, von denen einer zum Ausdruck bringt, dass die Blöcke vonSpektralwerten der beiden Kanäle ähnlich sind,oder das in seinem anderen Zustand aussagt, dass die Blöcke vonSpektralwerten fürjeden Kanal unähnlichsind. Die Entscheidung darüber,ob Ähnlichkeitoder Unähnlichkeitvorherrscht, kann unter Verwendung eines vorzugsweise numerischen Ähnlichkeitsmaßes getroffenwerden. [0037] Soexistieren verschiedene Möglichkeiten zurBestimmung der Ähnlichkeitzwischen den zwei Blöckenvon Spektralwerten fürjeden Kanal, von denen eine Möglichkeiteine Kreuzkorrelationsberechnung ist, die einen Wert ergibt, derdann mit einer vorbestimmten Ähnlichkeitsschwelleverglichen werden kann. Alternative Ähnlichkeitsmessverfahren sindbekannt, wobei eine bevorzugte Form nachfolgend beschrieben wird. [0038] Sowohlder Block von Spektralwerten fürden linken Kanal als auch der Block von Spektralwerten für den rechtenKanal wird einer Einrichtung 16 zum Durchführen einerPrädiktionsfilterungzugeführt.Insbesondere wird eine Prädiktionsfilterung über der Frequenzdurchgeführt,wobei die Einrichtung zum Durchführenausgebildet ist, um zum Durchführen derPrädiktion über derFrequenz ein gemeinsames Prädiktionsfilter 16a für den Blockvon Spektralwerten des ersten Kanals und für den Block von Spektralwertendes zweiten Kanals zu verwenden, wenn die Ähnlichkeit größer alseine Schwellenähnlichkeit ist.Wird der Einrichtung 16 zum Durchführen der Prädiktionsfilterung dagegen vonder Einrichtung 12 zum Ermitteln einer Ähnlichkeit mitgeteilt, dassdie beiden Blöckevon Spektralwerten fürjeden Kanal unähnlichsind, also eine Ähnlichkeithaben, die kleiner als eine Schwellenähnlichkeit ist, so wird dieEinrichtung 16 zum Durchführen der Prädiktionsfilterung unterschiedlicheFilter 16b auf den linken und den rechten Kanal anwenden. [0039] DieAusgangssignale der Einrichtung 16 sind somit spektraleRestwerte des linken Kanals an einem Ausgang 18a als auch spektraleRestwerte des rechten Kanals an einem Ausgang 18b, wobei,je nach Ähnlichkeitdes linken und des rechten Kanals die spektralen Restwerte der beidenKanäleunter Verwendung des selben Prädiktionsfilters(Fall 16a) oder unter Verwendung unterschiedlicher Prädiktionsfilter(Fall 16b) erzeugt worden sind. [0040] Jenach tatsächlicherCodiererimplementierung könnendie spektralen Restwerte des linken und des rechten Kanals entwederdirekt oder nach mehreren Verarbeitungen, wie sie z. B. im AAC-Standard vorgesehensind, einem Mitte/Seite-Stereocodierer zugeführt werden,welcher an einem Ausgang 21a das Mitte-Signal als Hälfte derSumme von linkem und rechtem Kanal ausgibt, während das Seite-Signal alsHälfteder Differenz von linkem und rechtem Kanal ausgegeben wird. [0041] Wiees ausgeführtworden ist, ist das Seite-Signal nunmehr, aufgrund der Synchronisierung derTNS-Verarbeitung der beiden Kanäle,kleiner als in dem Fall, bei dem für ähnliche Kanäle unterschiedliche TNS-Filterverwendet werden, was somit, aufgrund der Tatsache, dass das Seite-Signalkleiner ist, einen höherenCodiergewinn in Aussicht stellt. [0042] Nachfolgendwird Bezug nehmend auf 2 ein bevorzugtes Ausführungsbeispielder vorliegenden Erfindung dargestellt, bei dem in der Einrichtung 12 zumErmitteln einer Ähnlichkeitbereits die erste Stufe der TNS-Berechnung durchgeführt wird,nämlichdie Berechnung der Parcor- bzw. Reflexionskoeffizienten und desPrädiktionsgewinnsfür sowohlden linken Kanal als auch den rechten Kanal, wie es durch die Blöcke 12a, 12b dargestelltist. [0043] DieseTNS-Verarbeitung liefert somit sowohl die Filterkoeffizienten für das letztendlichzu verwendende Prädiktionsfilterals auch den Prädiktionsgewinn,wobei dieser Prädiktionsgewinnauch dazu benötigtwird, um zu entscheiden, ob überhaupteine TNS-Verarbeitung durchgeführtwerden soll oder nicht. [0044] DerPrädiktionsgewinnfür denersten, linken Kanal, der in 2 mit PG1bezeichnet ist, wird ebenso wie der Prädiktionsgewinn für den rechten Kanal,der in 2 mit PG2 bezeichnet ist, in eine Ähnlichkeitsmaßbestimmungseinrichtungeingespeist, die in 2 mit 12c bezeichnetist. Diese Ähnlichkeitsbestimmungseinrichtungist wirksam, um den absoluten Betrag der Differenz zwischen den beidenPrädiktionsgewinnenzu berechnen und zu schauen, ob dieser unter einer vorbestimmtenAbweichungsschwelle S ist. Liegt der absolute Betrag der Differenzder Prädiktionsgewinneunterhalb der Schwelle S, so wird davon ausgegangen, dass die beidenSignale ähnlichsind, und die Frage im Block 12c wird mit Ja beantwortet.Wird dagegen festgestellt, dass die Differenz größer als die ÄhnlichkeitsschwelleS ist, so wird die Frage mit Nein beantwortet. Im Falle der Beantwortungdieser Frage mit Ja wird in der Einrichtung 16 ein gemeinsamesFilter für beideKanäleL und R verwendet, währendim Falle der Beantwortung der Frage im Block 12c mit Nein getrennteFilter verwendet werden, also eine TNS-Verarbeitung, wie im Stand der Technikdurchgeführtwerden kann. [0045] Hierzuwird der Einrichtung 16 ein Satz von FilterkoeffizientenFKL fürden linken Kanal und ein Satz von Filterkoeffizienten FKR für den rechtenKanal von den Einrichtungen 12a bzw. 12b zugeführt. [0046] Beieinem bevorzugten Ausführungsbeispiel dervorliegenden Erfindung wird zur Filterung mittels eines gemeinsamenFilters eine besondere Auswahl in einem Block 16c getroffen.Im Block 16c wird entschieden, welcher Kanal die größere Energiehat. Wird festgestellt, dass der linke Kanal die größere Energiehat, so werden die von der Einrichtung 12a für den linkenKanal berechneten Filterkoeffizienten FKL für die gemeinsame Filterungverwendet. Wird dagegen im Block 16c festgestellt, dassder rechte Kanal die größere Energiehat, so wird zur gemeinsamen Filterung der Satz von FilterkoeffizientenFKR, der fürden rechten Kanal in der Einrichtung 12b berechnet wordenist, verwendet. [0047] Wiees aus 2 hervorgeht, kann zur Energiebestimmung sowohldas Zeitsignal als auch das Spektralsignal verwendet werden. Aufgrundder Tatsache, dass im Spektralsignal bereits möglicherweise sattgefundeneTransformations-Artefakteenthalten sind, wird es bevorzugt, zur „Energieentscheidung" im Block 16c dieSpektralsignale des linken und rechten Kanals zu verwenden. [0048] Ineinem bevorzugten Ausführungsbeispiel dervorliegenden Erfindung wird eine TNS-Synchronisierung, also dieVerwendung der selben Filterkoeffizienten für beide Kanäle eingesetzt, wenn sich die Prädiktionsgewinnefür denlinken und rechten Kanal um weniger als drei Prozent unterscheiden.Unterscheiden sich beide Kanäleum mehr als drei Prozent, wird die Frage im Block 12C von 2 mit „Nein" beantwortet. [0049] Wiees bereits ausgeführtWorden ist, werden – imSinne einer einfachen und wenig rechenintensiven Detektion der Ähnlichkeit – die Prädiktionsgewinneder beiden Kanälebei der Filterung verglichen. Unterschreitet eine Differenz derPrädiktionsgewinneeine bestimmte Schwelle, werden beide Kanäle mit der gleichen TNS-Filterungbeaufschlagt, um die beschriebenen Probleme zu vermeiden. [0050] Alternativkann auch ein Vergleich der Reflexionskoeffizienten der beiden separatberechneten TNS-Filter erfolgen. [0051] Wiederalternativ kann die Ähnlichkeitsbestimmungauch unter Verwendung anderer Details des Signals erreicht werden,so dass dann, wenn eine Ähnlichkeitbestimmt worden ist, nur der TNS-Filterkoeffizientensatz für den Kanalberechnet werden muss, der fürdie Prädiktionsfilterungbeider Stereokanäleeingesetzt werden wird. Dies hat zum Vorteil, dass, wenn 2 betrachtetwird, und wenn die Signale ähnlichsind, nur entweder der Block 12a oder der Block 12b aktivsein wird. [0052] Darüber hinauskann das erfindungsgemäße Konzeptferner dahin gehend eingesetzt werden, um die Bitrate des codiertenSignals weiter zu reduzieren. Währendbei der Verwendung zweier unterschiedlicher Reflexionskoeffizientenunterschiedliche TNS-Seiteninformationen für beide Kanäle übertragen werden, müssen beider Filterung der beiden Kanälemit dem selben Prädiktionsfilternur einmal TNS-Informationenfür beideKanäle übertragenwerden. Daher kann durch das erfindungsgemäße Konzept auch eine Reduktionder Bitrate dahin gehend erreicht werden, dass ein Satz von TNS-Seiteninformationen „eingespart" wird, wenn linkerund rechter Kanal ähnlichsind. [0053] Daserfindungsgemäße Konzeptist nicht grundsätzlichauf Stereo-Signale beschränkt,sondern könntein einer Mehrkanalumgebung zwischen verschiedenen Kanalpaaren oderauch Gruppen von mehr als 2 Kanälenangewandt werden. [0054] Zur Ähnlichkeitsbestimmungkann, wie es ausgeführtworden ist, eine Bestimmung des Kreuzkorrelationsmaßes k zwischenlinkem und rechtem Kanal oder eine Bestimmung des TNS-Prädiktionsgewinnsund der TNS-Filterkoeffizienten für jeden Kanal separat erfolgen. [0055] DieSynchronisationsentscheidung erfolgt, falls k eine Schwelle überschreitet(z. B. 0.6) und MS-Stereo-Coding aktiviert ist. Das MS-Kriterium kannauch weggelassen werden. [0056] Beider Synchronisation erfolgt eine Bestimmung des Referenzkanals,dessen TNS-Filter fürden anderen Kanal übernommenwerden soll. Z. B. wird der Kanal mit der größeren Energie als Referenzkanalverwendet. Insbesondere erfolgt dann ein Kopieren der TNS-Filterkoeffizientenvom Referenzkanal auf den anderen Kanal. [0057] Schließlich erfolgteine Anwendung der synchronisierten oder nicht-synchronisiertenTNS-Filter auf das Spektrum. [0058] Alternativerfolgt eine Bestimmung des TNS-Prädiktionsgewinnsund der TNS-Filterkoeffizienten für jeden Kanal separat. Dannerfolgt eine Entscheidung. Falls sich der Prädiktionsgewinn beider Kanäle um nichtmehr als ein gewisses Maß unterscheidet,z. B. 3% erfolgt, erfolgt die Synchronisation. Hier kann der Referenzkanalauch willkürlichgewählt werden,wenn man von einer Ähnlichkeitder Kanäle ausgehenkann. Auch hier gibt es ein Kopieren der TNS-Filterkoeffizientenvom Referenzkanal auf den anderen Kanal, woraufhin eine Anwendungder synchronisierten oder nicht-synchronisierten TNS-Filter aufdas Spektrum stattfindet. [0059] AlternativeMöglichkeitenSind folgende: Ob TNS in einem Kanal grundsätzlich aktiviert wird, hängt vomPrädiktionsgewinnin diesem Kanal ab. Überschreitetdieser eine gewisse Schwelle, wird TNS für diesen Kanal aktiviert. Alternativwird auch eine TNS-Synchronisation für 2 Kanäle gemacht, wenn nur in einemder beiden KanäleTNS aktiviert war. Bedingung ist dann, dass z. B. der Prädiktionsgewinn ähnlich ist,also ein Kanal knapp überder Aktivierungsgrenze, und ein Kanal knapp unter der Aktivierungsgrenzeliegt. Aus diesem Vergleich wird dann die Aktivierung von TNS für beideKanälemit gleichen Koeffizienten abgeleitet, oder unter Umständen auchdie Deaktivierung fürbeide Kanäle. [0060] Abhängig vonder Gegebenheit, kann das erfindungsgemäße Verfahren zum Verarbeiteneines Mehrkanalsignals in Hardware oder in Software implementiertwerden. Die Implementierung kann auf einem digitalen Speichermedium,insbesondere einer Diskette oder CD mit elektronisch auslesbarenSteuersignalen erfolgen, die so mit einem programmierbaren Computersystemzusammenwirken können, dassdas Verfahren ausgeführtwird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produktmit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zurDurchführungdes erfindungsgemäßen Verfahrens,wenn das Computer-Programm-Produkt auf einem Rechner abläuft. Inanderen Worten ausgedrückt,kann die Erfindung somit als ein Computer-Programm mit einem Programmcodezur Durchführungdes Verfahrens realisiert werden, wenn das Computer-Programm auf einemComputer abläuft.
权利要求:
Claims (13) [1] Vorrichtung zum Verarbeiten eines Multikanalsignals,wobei das Multikanalsignal durch je einen Block von Spektralwertenfür wenigstenszwei Kanäledargestellt ist, mit folgenden Merkmalen: einer Einrichtung(12) zum Ermitteln einer Ähnlichkeit zwischen einem erstender zwei Kanäleund einem zweiten der zwei Kanäle; einerEinrichtung (16) zum Durchführen einer Prädiktionsfilterung,wobei die Einrichtung zum Durchführenausgebildet ist, um zum Durchführen der Prädiktionsfilterung ein gemeinsamesPrädiktionsfilterfür denBlock von Spektralwerten des ersten Kanals und den Block von Spektralwertendes zweiten Kanals zu verwenden, wenn eine Ähnlichkeit größer alseine Schwellenähnlichkeitist, und um zur Durchführungder Prädiktionsfilterungzwei unterschiedliche Prädiktionsfilterzu verwenden, wenn die Ähnlichkeitkleiner als eine Schwellenähnlichkeitist. [2] Vorrichtung nach Anspruch 1, bei der die Einrichtung(16) zum Durchführenausgebildet ist, um als ein Ergebnis der Prädiktion spektrale Restwerteauszugeben, und wobei die Vorrichtung ferner folgendes Merkmalaufweist: eine Einrichtung (20) zum gemeinsamen Codieren vonspektralen Restwerten oder von den spektralen Restwerten abgeleitetenWerten des ersten Kanals und von spektralen Restwerten oder vonden spektralen Restwerten abgeleiteten Werten des zweiten Kanals,wenn die Ähnlichkeitgrößer alseine Schwellenähnlichkeitist. [3] Vorrichtung nach Anspruch 2, bei der die gemeinsameCodierung eine Mitte/Seite-Codierung ist. [4] Vorrichtung nach Anspruch 3, bei der die Einrichtungzum gemeinsamen Codieren (20) ausgebildet ist, um auf derBasis einer Summe des ersten und des zweiten Kanals ein Mitte-Signalzu berechnen, und um auf der Basis einer Differenz des ersten und deszweiten Kanals ein Seite-Signal zu berechnen. [5] Vorrichtung nach einem der vorhergehenden Ansprüche, beider der Block von Spektralwerten für einen Kanal ein Kurzzeitspektrumdieses Kanals darstellt, oder bei der der Block von Spektralwerteneine Mehrzahl von Bandpasssignalen für eine Mehrzahl von Subbändern umfasst. [6] Vorrichtung nach einem der vorhergehenden Ansprüche, beider die Einrichtung (16) zum Durchführen ausgebildet ist, um eineTNS-Verarbeitung durchzuführen. [7] Vorrichtung nach einem der vorhergehenden Ansprüche, beider die Einrichtung (12) zum Ermitteln ausgebildet ist,um eine Kreuzkorrelation des ersten und des zweiten Kanals zu berechnen. [8] Vorrichtung nach einem der vorhergehenden Ansprüche, beider die Einrichtung (12) zum Ermitteln ausgebildet ist,um einen ersten Prädiktionsgewinn auseiner Prädiktiondes Blocks des ersten Kanals und einen zweiten Prädiktionsgewinnaus einer Prädiktiondes Blocks des zweiten Kanals zu berechnen. [9] Vorrichtung nach Anspruch 8, bei der die Einrichtung(16) zum Durchführenausgebildet ist, um ein einziges Prädiktionsfilter zu verwenden,wenn der erste Prädiktionsgewinnund der zweite Prädiktionsgewinnum weniger als oder gleich drei Prozent unterschiedlich sind. [10] Vorrichtung nach einem der vorhergehenden Ansprüche, beider die Einrichtung (16) zum Durchführen ausgebildet ist, um alsgemeinsames Prädiktionsfilterein Prädiktionsfilterzu verwenden, dessen Koeffizienten von dem Block von Spektralwertenabgeleitet sind, der mehr Energie enthält als der andere Block vonSpektralwerten. [11] Vorrichtung nach einem der vorhergehenden Ansprüche, beider die Einrichtung (16) zum Durchführen ausgebildet ist, um zurPrädiktion über der Frequenzeine Autokorrelationsberechnung und eine LPC-Berechnung unter Verwendungdes Levinson-Durbin-Algorithmus mit dem Block von Spektralwertendurchzuführen,um Parcor-Koeffizientenoder Reflexionskoeffizienten sowie einen Prädiktionsgewinn zu erhalten,und um den Block von Spektralwerten mit dem Parcor-Koeffizientenzu filtern, um spektrale Restwerte zu erhalten. [12] Verfahren zum Verarbeiten eines Multikanalsignals,wobei das Multikanalsignal durch je einen Block von Spektralwertenfür wenigstenszwei Kanäledargestellt ist, mit folgenden Schritten: Ermitteln (12)einer Ähnlichkeitzwischen einem ersten der zwei Kanäle und einem zweiten der zweiKanäle; Durchführen einerPrädiktionsfilterungmit einem gemeinsamen Prädiktionsfilterfür denBlock von Spektralwerten des ersten Kanals und den Block von Spektralwertendes zweiten Kanals, wenn eine Ähnlichkeitgrößer alseine Schwellenähnlichkeitist, und Durchführender Prädiktionsfilterungmit zwei unterschiedlichen Prädiktionsfilternfür denBlock von Spektralwerten des ersten Kanals und den Block von Spektralwertendes zweiten Kanals, wenn die Ähnlichkeitkleiner als eine Schwellenähnlichkeitist. [13] Computer-Programm mit einem Programmcode zum Durchführen desVerfahrens zum Verarbeiten eines Multikanalsignals nach Anspruch12, wenn das Programm auf einem Computer abläuft.
类似技术:
公开号 | 公开日 | 专利标题 US10297259B2|2019-05-21|Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding US9805728B2|2017-10-31|Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value US10580418B2|2020-03-03|Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing US9620132B2|2017-04-11|Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation ES2604983T3|2017-03-10|Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio JP5253564B2|2013-07-31|合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム EP2378518B1|2018-01-24|Mischung von Eingabedatenströmen und Erzeugung eines Ausgangsdatenstroms daraus AU2011237877B2|2014-08-07|MDCT-based complex prediction stereo coding US6424939B1|2002-07-23|Method for coding an audio signal JP5189979B2|2013-04-24|聴覚事象の関数としての空間的オーディオコーディングパラメータの制御 KR100304055B1|2001-11-03|음성 신호 부호화동안 잡음 대체를 신호로 알리는 방법 KR101414737B1|2014-07-04|다운믹스 신호 표현에 기초하여 업믹스 신호 표현을 제공하기 위한 장치, 다중 채널 오디오 신호를 표현하는 비트스트림을 제공하기 위한 장치, 선형 결합 파라미터를 이용하여 다중 채널 오디오 신호를 표현하는 방법, 컴퓨터 프로그램 및 비트스트림 JP5171256B2|2013-03-27|ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 KR101178060B1|2012-08-30|공간 오디오 코딩에서의 복수채널 역상관 US9153240B2|2015-10-06|Transform coding of speech and audio signals RU2625444C2|2017-07-13|Система обработки аудио US8135585B2|2012-03-13|Method and an apparatus for processing a signal US8583445B2|2013-11-12|Method and apparatus for processing a signal using a time-stretched band extension base signal KR100878371B1|2009-01-15|공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화 EP2959479B1|2019-07-03|Verfahren zur parametrischen mehrkanalcodierung KR100954179B1|2010-04-21|근접-투명 또는 투명 멀티-채널 인코더/디코더 구성 US9728196B2|2017-08-08|Method and apparatus to encode and decode an audio/speech signal TWI498882B|2015-09-01|Audio decoder US8258849B2|2012-09-04|Method and an apparatus for processing a signal KR101444102B1|2014-09-26|스테레오 오디오의 부호화, 복호화 방법 및 장치
同族专利:
公开号 | 公开日 NO339114B1|2016-11-14| CA2558161A1|2005-09-09| CA2558161C|2010-05-11| AT364882T|2007-07-15| IL177213D0|2006-12-10| DE502005000864D1|2007-07-26| DK1697930T3|2007-10-08| JP2007525718A|2007-09-06| RU2332727C2|2008-08-27| AU2005217517A1|2005-09-09| KR20060121982A|2006-11-29| DE102004009954B4|2005-12-15| ES2286798T3|2007-12-01| WO2005083678A1|2005-09-09| BRPI0507207A|2007-06-12| AU2005217517B2|2008-06-26| NO20064431L|2006-09-29| RU2006134641A|2008-04-10| US7340391B2|2008-03-04| JP4413257B2|2010-02-10| EP1697930B1|2007-06-13| KR100823097B1|2008-04-18| CN1926608B|2010-05-05| HK1095194A1|2007-04-27| EP1697930A1|2006-09-06| PT1697930E|2007-09-25| US20070033056A1|2007-02-08| IL177213A|2011-10-31| BRPI0507207B1|2018-12-26| CN1926608A|2007-03-07|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2005-09-29| OP8| Request for examination as to paragraph 44 patent law| 2006-06-08| 8364| No opposition during term of opposition|
优先权:
[返回顶部]
申请号 | 申请日 | 专利标题 DE200410009954|DE102004009954B4|2004-03-01|2004-03-01|Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals|DE200410009954| DE102004009954B4|2004-03-01|2004-03-01|Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals| BRPI0507207A| BRPI0507207B1|2004-03-01|2005-02-28|equipamento e método para o processamento de um sinal multicanais| PT05715611T| PT1697930E|2004-03-01|2005-02-28|Equipamento e método para o processamento de um sinal multi-canais| DK05715611T| DK1697930T3|2004-03-01|2005-02-28|Apparat og fremgangsmåde til behandling af et multikanalsignal| JP2007501191A| JP4413257B2|2004-03-01|2005-02-28|Apparatus and method for processing multi-channel signals| PCT/EP2005/002110| WO2005083678A1|2004-03-01|2005-02-28|Vorrichtung und verfahren zum verarbeiten eines multikanalsignals| DE200550000864| DE502005000864D1|2004-03-01|2005-02-28|Vorrichtung und verfahren zum verarbeiten eines multikanalsignals| CN2005800068249A| CN1926608B|2004-03-01|2005-02-28|多声道信号处理设备和方法| ES05715611T| ES2286798T3|2004-03-01|2005-02-28|Dispositivo y procedimiento para procesar una señal multicanal.| CA 2558161| CA2558161C|2004-03-01|2005-02-28|Device and method for processing a multi-channel signal| KR1020067016991A| KR100823097B1|2004-03-01|2005-02-28|멀티채널 신호를 처리하는 장치 및 방법| RU2006134641/09A| RU2332727C2|2004-03-01|2005-02-28|Устройство и способ обработки многоканального сигнала| AT05715611T| AT364882T|2004-03-01|2005-02-28|Vorrichtung und verfahren zum verarbeiten eines multikanalsignals| EP05715611A| EP1697930B1|2004-03-01|2005-02-28|Vorrichtung und verfahren zum verarbeiten eines multikanalsignals| AU2005217517A| AU2005217517B2|2004-03-01|2005-02-28|Device and method for processing a multi-channel signal| IL17721306A| IL177213A|2004-03-01|2006-08-01|Apparatus and method for processing a multi-channel signal| US11/464,315| US7340391B2|2004-03-01|2006-08-14|Apparatus and method for processing a multi-channel signal| NO20064431A| NO339114B1|2004-03-01|2006-09-29|Prosessering av et multikanalsignal| HK07101657A| HK1095194A1|2004-03-01|2007-02-12|Device and method for processing a multi-channel signal| 相关专利
Sulfonates, polymers, resist compositions and patterning process
Washing machine
Washing machine
Device for fixture finishing and tension adjusting of membrane
Structure for Equipping Band in a Plane Cathode Ray Tube
Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an
国家/地区
|